侧通道攻击对加密算法构成了严重的威胁,包括广泛使用的算法,例如AES和RSA,利用硬件或软件中的算法实现,以通过计时和/或电力侧通道来提取秘密信息。软件掩蔽是一种针对电力侧通道攻击的软件缓解方法,旨在将秘密浏览依赖性隐藏在脆弱实现的功率足迹之外。但是,这种类型的软件缓解通常取决于通用编译器,这些编译器不保留非功能性能。此外,Microarchitectural特征(例如内存总线和寄存器重复使用)也可能揭示秘密信息。这些抽象在该程序的高级实施中不可见。相反,它们是在编译时间决定的。为了解决这些问题,安全工程师通常通过关闭编译器优化和/或执行本地兼容后转换来牺牲代码效率。本文提出了SECCONCG,这是一种基于约束的编译器方法,该方法生成了优化但安全的代码。 SECCONCG通过根据处理器成本模型有效地搜索最佳的低级实施来控制缓解程序的质量。在我们在MIPS32和ARM Cortex M0上进行十项掩盖实现的实验中,与非优化优化代码相比,SECCONCG的速度将生成的代码从10%提高到10%至10倍。对于安全和编译器研究人员,本文提出了一个正式模型,以生成安全的低级代码。对于软件工程师,SECCONCG提供了一种实用方法来优化保留安全属性的代码。
translated by 谷歌翻译
现代软件部署过程产生统一的软件,因此容易受到大规模的代码重用攻击,例如跳转编程(JOP)攻击。基于编译器的多样化通过自动生成给定程序的不同装配代码版本来提高软件系统的恢复。现有技术是有效的,但不具有对所产生变体的质量的精确控制。本文介绍了建筑(Divcon)的多样性,基于约束的软件多样化方法。与以前的方法不同,Divcon允许用户控制和调整多样性和代码质量的冲突目标。关键推动器是使用大型邻域搜索(LNS)以有效地生成高度多样化的代码。对于更大的问题,我们提出了LNS的组合,其结构分解了问题。为了进一步提高Divcon对JOP攻击的多样化效率,我们提出了一种针对JOP攻击特征的特定于应用的距离测量。我们评估嵌入式系统的流行基准套件20个功能。这些实验表明,LNS和我们的应用程序特定距离测量的组合产生了对JOP攻击具有高度弹性的二进制程序。我们的结果证实,每个汇编代码版本和整个版本池的多样性之间存在权衡。特别是,实验表明,Divcon生成近最佳的二进制程序,这些程序共享少量小工具。对于约束编程研究人员和从业者,本文表明LNS是寻找多样化解决方案的宝贵技术。对于安全研究人员和软件工程师,Divcon将基于编译的多样化范围扩展到性能关键和资源受限应用程序。
translated by 谷歌翻译
In this paper, we present a novel method for phoneme-level prosody control of F0 and duration using intuitive discrete labels. We propose an unsupervised prosodic clustering process which is used to discretize phoneme-level F0 and duration features from a multispeaker speech dataset. These features are fed as an input sequence of prosodic labels to a prosody encoder module which augments an autoregressive attention-based text-to-speech model. We utilize various methods in order to improve prosodic control range and coverage, such as augmentation, F0 normalization, balanced clustering for duration and speaker-independent clustering. The final model enables fine-grained phoneme-level prosody control for all speakers contained in the training set, while maintaining the speaker identity. Instead of relying on reference utterances for inference, we introduce a prior prosody encoder which learns the style of each speaker and enables speech synthesis without the requirement of reference audio. We also fine-tune the multispeaker model to unseen speakers with limited amounts of data, as a realistic application scenario and show that the prosody control capabilities are maintained, verifying that the speaker-independent prosodic clustering is effective. Experimental results show that the model has high output speech quality and that the proposed method allows efficient prosody control within each speaker's range despite the variability that a multispeaker setting introduces.
translated by 谷歌翻译
本文介绍了一种在自回归关注文本到语音系统中控制音素级别的韵律的方法。除了通常完成的常见框架中,我们将从培训集中的语音数据中直接提取音素级F0和持续时间特征,而不是学习潜在韵律特征。每个韵律特征是使用无监督聚类离散化,以便为每个话语产生一系列韵律标签。该序列与音素序列并行使用,以便通过利用韵律编码器和相应的注意模块来调节解码器。实验结果表明,该方法保留了高质量的生成语音,同时允许对F0和持续时间进行音素级控制。通过用音符替换F0集群质心,该模型还可以在扬声器范围内提供对音符和八度音的控制。
translated by 谷歌翻译
本文介绍了对F0的音素级韵律控制的方法和多销箱文本到语音设置的持续时间,基于韵律聚类。使用自回归关注的模型,并将多个箱子架构模块并联,与韵律编码器并联。提出了对基本单扬声器方法的几种改进,从而增加了韵律控制范围和覆盖范围。更具体地说,我们采用数据增强,F0​​标准化,持续时间的平衡集群,以及扬声器无关的韵律聚类。这些修改使培训集中包含的所有发言者能够进行细粒度的音素级韵律控制,同时保持扬声器标识。该模型也可以微调到具有限制数据量的看不见的扬声器,并显示其维持其韵律控制能力,验证说话者无关的韵律聚类是有效的。实验结果验证了该模型维持了高输出语音质量,并且该方法允许在每个扬声器范围内有效的韵律控制,尽管多种式箱子设置介绍的变化。
translated by 谷歌翻译
在本文中,介绍了文本到读取/唱歌系统,可以适应任何扬声器的声音。它利用基于TacoTron的多级箱子声学模型在只读语音数据训练,并且在音素级别提供韵律控制。还研究了基于传统DSP算法的数据集增强和额外的韵律操纵。神经TTS模型对看不见的扬声器的有限录音进行了微调,允许与目标的扬声器语音进行敲击/歌唱合成。描述了系统的详细管道,其包括从Capella歌曲的目标音调和持续时间值提取,并将其转换为在合成之前的目标扬声器的有效音符范围内。还研究了通过WSOLA输出的输出的韵律操纵的另外的阶段,以便更好地匹配目标持续时间值。合成的话语可以与乐器伴奏轨道混合以产生完整的歌曲。通过主观聆听测试评估所提出的系统,以及与可用的备用系统相比,该系统还旨在从只读训练数据产生合成歌唱语音。结果表明,该拟议的方法可以产生高质量的敲击/歌声,具有增加的自然。
translated by 谷歌翻译